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= (54) Titre : PROTfellSrE RECOMBINANTE CHIMfiRIQUE ET DIAGNOSTIC IN VTTRO 

(57) Abstract: The imrention relates to recombinant DNA coding for a chimeric recombinant protein comprising at least two fiist 
nucleotide fragments, each coding an epitopic region of the HIV -1 vims of group M or group O or the virus HIV-2, at least one 
second nucleotide fragment coding a linking region, at least one third nucleotide fragment coding a fixing region, characterized in 
that each fiist nucleotide fragment codes at least one immunodominant region of glycoprotein gp 120 of HIV- 1, of glycoprotein gp 

^ 41of HIV-1 of group M, of glycoprotein gp 41 of MV-l of group O or glycoprotein gp 36 of HrV-2. The invention also contains a 
recombinant chimeric protein coded by the above-mentioned DNA, and the use of said DNA and/or said recombinant protein for in 

fK| vitro diagnosis. 



(57) Abrege : L' invention conceme un ADN recombinant codant une prot6ine recombinante chim6rique comprenant - au moins 
deux premiers fragments nucl6otidiques codant chacun une region ^pitopique du virus HIV- I de groupe M ou de gioupe O ou 

^ le virus HIV-2 - au moins un deuxifeme fragment nucltotidique codant une region de liaison, - au moins un troisi&me fragment 
nucl^otidique codant une region de fixation caract£ris6 en ce que chaque premier fragment nucl£otidique code au moins une region 
immunodominante de la glycoprot^ine gp 120 d* HIV-1, de la glycoprot^ine gp 41 d'HIV-1 de groupe M, de la glycoprot^ine gp 41 

^ d'HIV-1 de groupe O ou de la glycoprot^ine gp 36 d'HIV-2. Uinvention conceme 6galement une protfiine chim6rique recombinante 
cod^ par T ADN d^fini ci dessus, ainsi que Tutilisation dudit ADN et/ou de ladite prot£ine recombinante pour le diagnostic in vitro. 
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Prot^e recombinante chimMque et diagnostic In vitro 



La pr^ente invention est relative k une prot^e recombinante chim&ique, un 
ADN codant ladite prot^e recombinante chimSrique, ainsi que I'utilisation de cette 
piot^ine recombinante dumSrique pour le diagnostic in vitro des maladies en relation 
avec un virus, plus particulidrement le virus HIV-1 ^ou et HIV-2. 

Le diagnostic pr6coce de la pr&ence d'un virus dans rorganisme est essential 
afin, d'une part, d'6viter la propa^tion du virus par les malades qui ne connaissent pas 
encore leur s6ropositivit6, et d'autre part, de propose: k ces patients un traitement 
adapte pour reculer la date d' apparition des symptomes. 

Dans le cas du SIDA (syndrome d'immunod6ficience acquise), consequence de 
rinfection par les retrovirus HIV-1 (human immimodefidency virus- 1) ou HIV-2 
(human immunodeficiency virus-2), la primo infection est suivie d'une p6riode 
asymptomatique, d'une durfe variable avant que la maladie n'^volue chez la plupart des 
patients en SIDA, caracteris^e par Tapparition d'infections k germes opportunistes, de 
tumeurs et de manifestations neurologiques, et le diagnostic pr^coce de la presence du 
virus HIV dans I'org^nisme doit gtre efFectu6 que le patient ait itiitialement 6t6 infects 
par fflV-l ou par HIV-2. 

La plupart des tests de diagnostic commercialis6s est base sur ime reaction 
antigdne-anticoxps dirig^e contre certaines prot6ines virales, telles que les protSines 
transmembranaires de Tenveloppe virale. Dans le cas d'HIV-1, les protfines de 
I'enveloppe sont deriv6es du g^ne env, qui code une glycoprotSine pr6curseur d'un 
poids mol^culaire de 160 000 daltons, denommee gp 160. La gp 160 est ensuite clivte 
en deux protSines virales de I'enveloppe, la gp 120 et la gp 41. Dans le cas d'HIV-2, la 
g^ycoprotdine precurseur est la gpl40, clivSe en gp36 et gpl05/l 10. Ainsi, dans Particle 
sdentifique de Vallari et al (Journal of microbiology, pages 3657-3661, 1998), on 
retrouve la description d'un kit de diagnostic permettant de detects* la presence de virus 
mV-l groupe M, HIV-1 groiq>e O et HrV-2, par I'utilisation de trois protfines 
recombinantes, d6riv6es des regions env de vims HIV-1 groupe M, HIV-1 groupe O et 
HIV-2. D'une fe9on comparable, dans Tarticle sdentifique de Shin et al (Biochemistry 
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and molecular biology intemaiional, volume 43, n*^4, pages 713-721, 1997), sont ddcrits 
des peptides multi-antigdniqaes pour detecter des infections aux virus HIV-1 ou HIV-2. 

Toutefois, dans de tels tests de diagnostic de plusieurs soudies viiales, il est 
n^cessaire lots de Tanalyse de s^ par la teclimque ELISA (Enzyme linked 
ImmunoSoibent Assay), de fixer sur le support plusieurs prot6ines recombinantes ayant 
des caractSristiques d'adsorption (ou coating) individuelles diff&entes, induisant des 
probl^es notamment lors de T^tape de revelation. De plus, la multiplicit6 des 
prot6ines recombinantes engendre des cofits de fabrication importants. 

Afin d'6viter ces probl^es de differences de coating entre les diff6rentes 
prot6ines recombinantes, d*autres tests de diagnostic utilisent pr6ferentiellement des 
prot^es recombinantes chim6riques, porteuses de plusieurs epitopes diriges centre des 
protSbies virales diff&rentes. 

Ainsi, le brevet EP-B-0 577 894 d6crit la construction d'une prot6ine 
recombinante clum6rique utiliste pour le diagnostic du SIDA. Cette proteine est 
porteuse des ^itopes dirig6s contre les prot6ines virales d&iv6es du gdne gag de HIV-2 
et contre la prot6ine gpl20 d'HIV-L Toutefois, cette proteine recombinante ne permet 
pas la d^ection simultante des patients infects par les virus HIV-1 de groiq>e M et O, 
ce qui peut induire des risques de &ux nSgati& (pa&wt d6tect6 s^nSgatif alors qu'il 
est porteur du virus), &ux n^gatife dont les cons6quences peuvent €tre dramatiques. De 
plus, cette prot^e recombinante n'est pas porteuse de I'Spitppe dirigS contre la gp41, 
qui est pourtant I'^tope immunodominant majeur, ce qui augmmte, ]h encore, le 
risque d's^parition de &ux n6gati£ De mdme, dans Particle sciCTtifique de Han et al 
(Biochemistry and molecular biology international, vol 46 n°3, 1998), il est dterit une 
prot^e recombinante prSsentant un Epitope diiigS contre la gp41 d'HIV-1, et un 
^itope dirig6 contre la gp36 d'HIV-2, ces deux epitopes Stant li^ par un peptide de 
liaison afin de permettre I'accessibilitS k chacun des ^itopes. Toutefois, cette prot&xe 
recombinante ne permet pas la detection simultan6e des patients infect&s par les virus 
HIV-1 de groupe M et O, ce qui peut induire, \k encore, des risques de feux n6gatifs. La 
demande de brevet DE 101 06 295 decrit une proteine recombinante comprenant 
plusieurs epitopes dirigfe contre HIV-1 ou HrV-2, li6s par des regions de liaisons, 
permettant d'immobilis^ la prot6ine recombioante sur im siqpport solide. Toutefois, les 
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regions ^pitopiques de cette protSboie recombinante permettent la reconnaissaace 
d'anticoxps dirigSs contre les produits du g^aie pol du virus HIV ^rot^ase, reverse 
transcriptase ou endonuclSase) ou contre la sequence qui constitue la boucle V3 de la 
gpl20. Les prot^es oodles par le gdae pol Stant relativement cons^6es d'xm virus k 

5 un autre, les antiooips dirig^s contre ces pieties sont pen sp6cifiques. De plus, les 
anticoips dirig^ contre les antigens pol d'un virus apparaissent chez les personnes 
infect£es tardivement ce qui ne pennet pas xm diagnostic de la maladie en d£but 
d'infection. II a 6t^ montr^ ^galement que le titre en anticoprs anti-antig^es pol 
diminue avec la progression de la maladie, et qu'en consequence, xin diagnostic 

10 feussement n6gatif pouvait fitre attribue a un malade en phase d*infection chronique. 

En ce qui conceme la sequence de la boucle V3 de la gpl20, cette sequence est 
hypervariable et Tutilisation de 2 ou 3 sequences dites sous types sp6cifiques ne 
garantie pas la d^ection de tous les anticoips dirig6s contre ce domaine : des r^sultats 
fBoissement n6gati& peuvent done etre obtenus. 

15 

La pr6sente invention se propose de r6soudre I'ensemble des inconv6nients de 
r^tat de la technique, en proposant une nouvelle prot6ine recombinante chim6rique, 
fadle k purifier et k synth6tiser, pr^entant une forte immunor6activit6 vis-i-vis de s6ra 
de patients susceptibles d'8tre infect^ par un ou plusieurs virus, tel que HIV-1, groupe 
20 M et ou O ou HIV-2. 

Les definitions suivantes permettront de mieux comprendre Tinvention. 
Par ADN recombinant on entend une sequence nucltotidique construite 
artifidellCTatent et obtenue par g6nie ^6tique. A titre indicati^ ledit ADN recombinant 
25 peut Stre ins6r6 dans un organisme hdte d'expression, tel que notamment une bactSrie, 
par un vecteur d'expression, notamment un plasmide bact6riCT ou un bacteriophage. 
Par fragment nucieotidiaue. on entend une succession d'au moins trois addes 
nucl6otidiqu^ codant au moins un adde amin6. 

Par site de coupure, on entend un site permettant la separation de deux firagments 
30 nucieotidiques par Taction d'au moins un moyen de coupure, tel que notamment une 
enzyme de restriction qui est capable, au niveau de site de coupure correspondant k une 
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Sequence nuclfotidique sp6cifiqae de g6n6rer pour chaque brin deux extrSmit^ Pime 
ayant un groiq>ecneat 3'-OH, Tautre un groupement S'-P. 

Par Drot6ine reoombinante chim6ricp ie. on entend une piot^e construite 
artifidellemeat et obteaue par g^e g^^tique. A litre indicati^ ladite prot^ine 
5 recombinante chim&ique peut 6tre produite par un oi;gamsme hdte d'e^qnression 
modifi^e gendtiquement par insertion de la s^uence nucl6otidiqae codant ladite 
prot6ine recx)mbinante chim6rique par un vecteur d'expression. 

Par region 6pitopique. on entend une region peptidique qui va iateragir de fafon 
st&^spScifique avec la region pqptidique paratopique de Tanticorps dirig6 contre le 

10 ntiicroorganisme, tel que notanmient le virus, present dans le s^rum du patient. Les 
regions 6pitopiques les plus immunog^ques sont dites inununodominantes. 
Par r6gion de liaison, on entend une r^on assurant une meilleure accessibilit6 des 
regions paratopiques des difG§rents anticoips pr^ents dans le s^rum des patients vis a 
vis des regions ^itopiques d*int&ret conrespondantes de la prot£uxe recombinante 

IS cbimdrique. 

Par r6gion de fixation, on entend une region pennettant de fixer ladite prot&ie 
recombinante diimSrique vis-&-vis : 

• d'un support, demani^ direct et/ou indirect, et/ou 

• d'une molecule de detection, 

20 Le support peut Stre compost de mat&iaux, tels que : 

• leven:e,unmat&iaupeuon6i:eux,inerteetm£caniquement stable, 

• les polym^res : plaques demicrotitradon... 

• les m6taux : colonne de m6tal chelate de chromatographie d'afBnit6, 

• les particules magn6tiques, telles que d6crites dans les demandes de brevet WO-A- 
25 97/34909, WO-A-97/45202, WO-A.98/47000 et WO-A-99/35500 d6pos6es par la 

demanderesse. 

Le siqpport peut alors 6tre utilise comme support d'analj^e, notamment lors d*un 
ELISA (Enzym Linked bimiunoSoibent Assay), pour des stapes de purification lors 
d'une chromatographie d'aifinitS, pour des 6tapes de lavage lorsque ladite prot6ine 
30 recombinante chim^que, fix6e sur une pardcule magn6tique est retenue par 
aimantadon dans un lieu pr6deteiniin& 
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Par molecule de detection, on entmd ime molecule associ66 k un maiqaear permettant 
de g&i&er directement ou indirectemeait un signal detectable. Ces marqueurs peuvent 
etxe notamment radioactifii, CTizymatiques, fluorescents. 

La fixation de la piot^e recombinante chim&ique sur ledit support ou ladite molecule 
5 de diction peat impliquer des Uganda capables de rSagir avec un anti-ligand. On peut 
dter k titre d'exemples les couples ligand/anti-ligand suivants : 

• biotine/streptavidine, 

• hapt^e/anticorps, 

• antig&ie/anticorps, ' 
10 • peptide/anticoips, 

• sucre/lectine, 

Ainsi, rinvention conceme un ADN recombinant oodant une prot6ine recombinante 
chim^rique compienant 

15 □ au moins deux premiers fiagments nucl&>tidiques codant chacun une r^g^on 

dpitopique du virus HIV-1 de groupe M ou de groiqpe O ou du virus HIV-2 

□ au moins un deuxidme fragment nucl6otidique codant une region de liaison, 

□ au moins untroisi^me fragment nucl6otidique oodant une region de fixation 
caract6rise en ce que diaque premier fi:agment nucltotidique code au moins une region 

20 immunodominante de la glycoprot^e gp 120 d'HIV-l» de la glyooprotdine gp 41 
d'HIV-1 de groiq>e M, de la glycoprotSine gp 41 d'HIV-1 de groupe O ou de la 
glycoprot6ine gp 36 d'HIV-2. 

n est bien 6videnmiCT^t que les regions variables de ces region immunodominante telle 
que notamment la boucle V3 de la gpl20 ne sont nuUement envisagdes dans la prSsente 
25 invention, 

Selon un mode pr6f(5r6 de realisation de I'invention, ledit premier fragment 
nucl6otidique a pour sequence Tune quelconque des sequences SEQ ID N°3, SEQ ID 
N°5, SEQ ID N°7, SEQ ID N^9, SEQ ID N^27, SEQ ID N^'ZP ou SEQ ID N^3 1 . 
Selon un autre mode pr6f6r6 de realisation de Tinvention, ledit deuxieme fragment 
30 nucleotidique compread au moins un site de coupure. Pr6ferentiellement, ledit 
deuxieme fi:agment nucl6otidique a pour sequence au moins Tune quelconque des 
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Sequences suivante, prisra seules ou en combinaison, SEQ ID N*"!! SEQ ID N**13, 
SEQ ID N**15, SEQ ID N**17, SEQ ID N«19, ou SEQ ID N*'20, SEQ ID N°33, SEQ ID 
N°35, SEQ ID N^37, SEQ ID N^39, SEQ ID N^41, SEQ ID N*^43 SEQ ID N«45, ou 
SEQIDN**47 

5 Selon un mode pi6f6r6 de realisation de Tinvention, ledit troisifane fragment 
nucl6otidique codant une region de fixation est inclus dans ledit deuxi&ne firagment 
nudtetidique codant une region de liaison. 

Selon un autre mode pref6r6 de realisation de I'invention, ledit troisi&ne fragment 
nuclfetidique a pour s6qumce Tune quelconque des sequences SEQ ID N^21, SEQ ID 
10 N° 23 23,ou SEQ ID N^25, SEQ ID N^33, SEQ ID N^35, SEQ ID N^37 ou SEQ ID 
N^39, 

Les sequences nucl6otidiques selon Tinvention peuvent Stre prepar^es par 
synthese chimique et genie genetique en utilisant les techniques bien connues de 
rhomme du metier et decrites par exemple dans Sambiook J. et al.. Molecular 
15 Cloning : A Laboratory Manual, 1989. 

Les sequences nucieotidiques de Tinvention peuvent €tre inserees dans des vecteurs 
d'cTqiression afin de preparer les proteines recombinantes de I'invention. 

L'invention concCTie ^alement une proteine recombinante chimerique codee par un 
20 ADN recombinant, tel que defini precedemment, comprenant 

□ au moins deux regions epitopiques du virus HIV-1 de groupe M ou de groupe O 
ou le virus HIV-2 d*au moins un microorganisme, 

a au moins une region de liaison 

□ au moins une region de fixation. 

25 Selon un mode "pxAfSire de realisation de I'invention, ladite region de liaison est un 
peptide comprenant au moins une glycine et/ou au moins une serine. 
Selon un autre mode prefSie de realisation de I'invention, ladite region de liaison a pour 
sequence Tune quelconque des sequences SEQ ID N** 12, SEQ ID N^14, SEQ ID N°16 
ou SEQ ID N^18, 34, 36, 38, 40, 42, 44, 46, 48. 

30 Selon un autre mode de realisation de I'invention, ladite region de fixation est une 
region riche en histidines et ses derives, tel qu'une region contenant une densite 
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d'histidines, sup^eure ou 6g3le k 25%, et pr6fi§reDtieIlement sup6rieure ou 6eaic k 
33%. 

Selon un autre mode de realisation de rinvebtion, ladite region de fixation est un 
peptide comprenant au moins ime lysine. 

Selon un mode pr6f6r6 de r6alisadon de Tinvention, ladite region de fixation a pour 
sequence SEQ ID N''22, 24 ou , 26, 34, 36, 38 ou 40. 

Les protdines lecombinantes de I'invention peuvent @tie obtenues par la 
technique du g^e g^n^tique qui comprend les Stapes de : 

- culture d'organismes hdtes ou de cellules eucaryotes transfi>im6es k Taide d'une 
sequaice nucl6otidique selon Tinvention et 

- r6ciq)6ration de la proteine produit par lesdits organismes h6tes ou lesdites cellules 
eucaryotes transform^es. 

Cette technique est bien connue de Thomme du metier. Pour plus de details la 
concemant, on pourra se r6f6rer k Touvrage ci-apres : Recombinant DNA Technology I, 
Editors Ales Prokop, Raskesh K Bajpai; Annals of the New-York Academy of 
Sdences, Volume 646, 1991. 

L'invention concecne 6galement un vecteur d*expression comprenant un ADN 
recombinant tel que d6fini pr6c6demment 

A titre de vecteur d'expression, on peut citer par exemple les plasmides, les 
vecteurs viraux type virus de la vaccine, adenovirus, baculovirus, les vecteurs 
bactSriens du type salmoneUe, BCG. 

On entmd par moyen n6cessaire k Texpression d'une piot^e, tout moyen qui 
permet d'obtenir ladite proteine, tel que notamment un promoteur, un tenninateur de 
transcription, une engine de replication et de pc6f6resnce un marqueur de selection. 
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Les vecteurs de rinvmtion peuvait Sgalement oonqirendre des sequences n^cessaires 
au dblage des prot^es vers des oompartiments cellulaiies paiticuliers. Un exCTiple de 
dblage peut Stre le dblage vers le r6ticulum endoplasmique obtemi en utilisant des 
sequences d'adresssage du type de la s6queiice leader issue de la proteine E3 de 

5 rad6novirus (Ciemik LF., et al.. The Journal of fimmmology, 1999, 162, 3915-3925). 

A titre d'exemples d'organismes h6tes qui conviennent aux fins de Tiavention, 
on peat citer les levures, telles que celles des families suivantes : Saccharomyces^ 
Schizosaccharomyces^ Kluverornyces^ Pichia, Hanselima, Yarowia, Schwaniomyces, 
ZygosaccharornyceSy Saccharomyces cerevisiaCy Saccharomyces carbbergensis et 

10 Kluveromyces lactis 6tant pr6f6r6es ; et les bact6ries, telles que E. coli et celles des 
ftmilles suivantes : Lactobacillus^ LactococcuSy Salmonella, Strptococcus, Bacillus et 
Streptomyces. 

A titre d'exemples de cellules eucaryotes, on peut citer les cellules provenant 
d'animaux tels que les mancaniferes, les reptiles, les insectes et Equivalent Les cellules 

IS eucaxyotes pr6fi§r6es sont les cellules prov^ant du hamster chinois (cellules CHO), du 
singe (cellules COS et Vero), du rein de hamster nain (cellules BHK), du rein de 
cochon (cellules PK 15) et du rdn de lapin (cellules RK13, les liguSes cellulaires 
humaines de rostfosaconne (cellules 143 B), les lignto cellulaires humaines HeLa et 
les ligndes cellulaires humaines de Thdpatome (du type cellules Hep G2), ainsi que les 

20 lignEes cellulaires d'insecte (par exemple de Spodopterajrugiperda). 

L^invention conceme enfin I'utilisation d'au moins un ADN td que d6£ini 
prScSdemment et/ou d'au moins une prot^me recombinante chim^rique telle que d6finie 
pr6cMemment pour le diagnostic in vitro. Cette utilisation permet la detection du virus 
25 HIV-1 de groiqie M et O ainsi que la detection du virus HIV-2. 

Les exemples suivants sont donnSs a titre illustratif et n'ont aucun caract^e 
limitatif. lis pecmettiont de mieux compieadre Tinvention. 
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Exemple 1 : Construction des prot^es chimiriques recombinantes b-HIV72, b- 
BSy96 et b-HIV98 permettant la reconnaissance d'antlcorps anti BSV-l groupe O 
etMetHIV-2. 

La sequence nucltotidique SEQ ID N°l a && con(ue pour coder une piot^e 
5 reooinbinaiite b-HIV72, et clonte dans un vecteur d'expiession. EUe correspond k la 
sequence suivante : 

SEQ ID N" 1 : ATG AGG GGA TCC AGA ATC CTA GCT GFTG GAA AGA T AC 
CTA AAG GAT CAA CAG CTC CTA GGG ATT TGG GGT TGC TCT GGA 
AAA CTC ATT TGC ACC ACT GCT GTG AGC TCC GGT TCA GGC GCT ATA 

10 GAG AAG TAC CTA CAG GAC CAG GCG CGG CTA AAT TCA TGG GGA 
TGT GCG TTT AGA CAA GTC TGC TCG AGC GGT TCT GGA GGA GGA 
GAT ATG AGG GAC AAT TGG AGA AGT GAA TTA TAT AAA TAT AAA 
GTA GTA AAA ATT GAA CCA TTA GGA GTA GCA CCC ACC AAG TCT 
GCA GGC CGT CTG CTT GCT CTG GAA ACC CTG CTT CAG AAC CAA 

15 CAG CTG CTT TCT CTG TGG GGT TGC AAA GGT AAG CTG GTT TGC 
TAC ACC TCT GTT AAA GCT TCC CAC CAT CAC CAT CAC CAT TGA TCT 
AGA 

La protSine recombinante cihim&ique b-HIV72 cod&e par la sequence SEQ ID N°l, 
comprend 137 acides amines, pour une masse mol6:ailaire de 15191,5 Da. Sa s^uoace 
20 en addes amines est la suivante: 

SEQ ID N°2 : MRGS RILAVERYLK DQQLLGIWGC SGKLICTTAV SSGSG 
AIEKYLQDQA RLNS WGCAFR QVC SSGS GGGDMRDNWR SELYKYKWK 
mPLGVAPTK SAG RLLALETLLQ NQQLLSLWG CKGKLVCYTS V KAS 
HHHHHH. 

25 La pirdsence de MRGS et la sequence ATG AGG GGA TCC coirespondante est 
introduite par la tedmique de donage utilise dans le vecteur d' expression pMR. La 
s^ueace d'int^ est introduite dans le vecteur pMR raitre le site de restriction BamHI 
en 5* et le site Xbal en 3% ce qui conduit h. la fusion de la sequence MRGS ea N- 
tenninal de la prot^e d'int&dt. Seul le codon d'initiation ATG et par cons6quent 

30 Tadde ainin6 Met est vraiment indispraisable dans cette sapience. 
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10 



15 



20 



25 



Les r6gLoiis ^topiques sont indiqu^es en gras, la region de fixation en italique et les 
regions de liaisons en non gras non italique. 



a) plusieurs r^ons ^pitopiques (indiqu6es en gras dans la SEQ ID n''2) permettant : 

• la reconnaissance des anticorps anti-HIV-1 (gronpe M : ep41\ : 

La s&pience SEQ ID N'^S est issue de la souche virale HIV-1 groupe M (clone de 
r6f6rence HXB2) et correspond k la sequence suivante : 

SEQ ID N°3 : AGA ATC CTA GCT GTG GAA AGA TAG OTA AAG GAT CAA 
GAG CTC CTA GGG ATT TGG GGT TGC TCT GGA AAA CTC ATT TGC AGO 
ACTGCTGTG, 

Cette sequence est amplifi6e par PGR (polymerase chain reaction) par Tutilisation 

d'amorces d'amplification sp^cifiques (amorce sense 5* AGT CGG ATC GAG AAT 

GCT AGG TGT GGA A 3' et amorce antisense 5' GGG TGA TGG GGA GGT GAG 

AGC AGT GGT GGA AAT 3' ; 17 cycles de PGR sont r6alis6s avec a chaque cycle 

une 6tape de d6naturation h 94^C pendant 1 minute (min), une 6tape d'hybridation i 

52X pendant 1 min et une 6tape d'61ongation 72''C pendant 20 secondes. 

Le firagment nuddotidique obtenu code pour le peptide correspondant k la sequence en 

addes amin& SEQ ID N^4 : RILAVERYLK DQQLLGIWGC SGKUGTTAV. 

• la recon naissance des anticorps anti-HIV-1 f groupe O : ^p4i\ : 

La sequence SEQ ID N"* 5 correspond k une s^enice ADN artificielle, con9ue k partxr 
de la s&iuence en acide amin£ de la souche virale HIV-1 groupe O [clone ANT70]. 
Gette portion synth6tique a 6t6 con^ue en selectionnant des codons dont Tutilisation est 
favorable k Texpression de gdne diez E. colL La sequence est la suivante : 
SEQ ID 5 : GGT GTG GTT GCT GTG GAA AGG GTG GTT GAG AAG GAA 
GAG GTG GTT TGT GTG TGG GGT TGG AAA GGT AAG GTG GTT TGG TAG 
AGC TGT GTT. 

Gette sequence est cohstruite par PGR par Tutilisation de 3 oligonucleotides (un 
oUgonuclfetide sens 5' AAG TGT GGA GGG GGT GTG GTT GCT GTG GAA AGC 
GTG CTT GAG AAG CAA GAG GTG GTT TCT 3' et deux oligonucleotides antisens 
5 ' GCT ATC TAG ATC AAT GGT GAT GGT GAT GGT GGG AAG CTT TAA GAG 
AGG TGT AGC AAA C 3' et 5' AAG AGA GGT GTA GGA AAG GAG GTT AGC 



Cette prot^ine recombinante dmnerique b-HIV72 comprend : 
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TTT GCA ACC CCA CAG AGA AAG CAG CTG TTG GTT 3' ; 17 cycles de PGR 
sont r6alis& avec h chaque cycle ime Stape de d^turation k 9°C pendant 1 mm^ une 
&ape d'hybridation k SO^'C peadant 1 min et ime £tape d'^lon^on dS^'C pendant 20 
secondes). 

5 Ce fiagment nucl^otidique code pour le peptide correspondant k la sequence en acides 
anim6s SEQ ID N^'e : RLLALETLLQ NQQLLSLWGC KGKLVCYTSV . 

• la reconnaissance des anticorps anti'HIV-2 fgD36^ : 
La sequence SEQ ID N**? est issue de la souche virale HIV-2 (clone de reference ROD) 
et correspond k la s&]uence suivante : 
10 SEQ ID N°7 : GCT ATA GAG AAG TAG CTA CAG GAC CAG GCG CGG CTA 
AAT TCA TGG GGA TGT GCG TTT AGA CAA GTC TGC 

Cette sequence est amplifi^e par PCR par Tutilisation d'amorces d'amplification 
sp6cifiques (amorce sense 5' CTG TGA GCT CCG GTT CAG GCG CTA TAG AGA 
AGT ACC T A 3 ' et amorce antisense 5 ' AGA ACC GCT CGA GCA GAC TTG TCT 
15 AAA CGC 3' ; 17 cycles de PCR sont r6alis6s avec k chaque cyde une 6tape de 
dfinaturadon k 94°C pendant 1 mm, une 6tape d'hybiidalion k 52°C pendant 1 min et 
une 6tape d'Slongation 72''C pendant 20 secondes). 

Ce j&agment nucl6otidique code pour le peptide correspondant k la sequence en acides 
amines SEQ ID N**8 : AIEKYLQDQA RLNSWGCAFR QVC. 
20 • la recnnnfli ssance des antioorps anti-HIV-1 (eroupe M : gDl20'> : 

La s6quence SEQ ID N^9 est issue de la souche virale HIV-1 gxyjspe M (clone de 
r6f6rence HXB2) et correspond k la sequence suivante : 

SEQ ID N^9 : GGA GGA GGA GAT ATG AGG GAC AAT TGG AGA AGT GAA 
TT A TAT AAA TAT AAA GTA GTA AAA ATT GAA CCA TTA GGA GTA GCA 

25 CCCACCAAG. 

Cette s^uenoe est amplifi^ par PCR par Tutilisation d'amorces d'amplification 
sp6dfiques (amorce srase 5* GTC TGC TCG AGC GGT TCT GGA GGA GGA GAT 
ATG AGG 3' et amorce antisens 5' ACG TCC TGC AGA CTT GGT GGG TGC TAG 
TCC 3* ; 17 cycles de PCR sont r6alis& comprenant k chaque cycle une 6tape de 

30 d^naturation k 94°C pendant Imin, une €tape d'hybridation k 52°C pendant 1 min et 
une 6tape d'^longation k 72°C pendant 20 secondes). 
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Ce firagment miclSotidique code pour le peptide CQnespondant k la sequence en addes 
amines SEQ ID N^O : GGQDMRDNWR SELYKYKWK DEPLGVAPTK 

b) des regions de liaisons, entre chacune des regions Spitopiques dt^es pr6c6denmient, 
pennettant : 

• au niveau nuclSotidique rintroduction de six sites de ooi^ure par des 
enzymes de restriction pouvant 6tre utilises pour modifier, retirer ou ajouter 
un domaine 6pitopique, et 

• au niveau prot6ique, Tobtention de regions d'espacement, flexibles, assurant 
une meilleure accessibilite des anticorps potentiels k diacun des domaines. 

Ainsi, la sequence nud6otidique SEQ ID N°l 1 : (7 AGC TCC GGT TCA GGC pemiet 
I'obtention d'un site de coupure par T enzyme Sac I (indiqu6 en gras), le G indiqu6 en 
italique, 6tant la demise base de la sequence nucl6otidique codant le peptide 
pennettant la recoimaissance des anticorps anti HTV-l, groupe M. Cette sequence code 
la region flexible oorrespondant au peptide de s^uence SEQ ID N°12 : SSG SG. 
La sequence nucl6otidique SEQ ID N°13 : C TCG AGC GGT TCT permet I'obtention 
d'un site de coiq>ure par T^izyme Xho I (indiqu6 en gras), le C indiqu6 en italique, 
6tant la decnidre base de la sequence nucltotidique codant le peptide pennettant la 
reconnaissance des anticorps anti HIV-2. Cette sequence code la r^on flexible 
oorrespondant au peptide de sequence SEQ ID N^14 : SSGS. 

La s6quence nud6otidique SEQ ID N^'IS : TCT CCA GGC pmnet Pobtention d'un 

site de coupure par Tenzyme Pst I (indiqu6 en gras), Cette sequence code la region 

flexible oorrespondant au peptide de s^uence SEQ ID 16 : SAG 

La sequence nucltotidique SEQ ID N^17 : AAA OCT TCC pennet Tobtention d*un 

site de coupure par Tenzyme Hind m (indiqu6 en gras). Cette s6quence code la region 

flexible oorrespondant au peptide de sequence SEQ ID N° 18 : KAS. 

Les sequences SEQ ID N°19 : ATG AGG GGA TCC et SEQ ID N^20 TGA TCT 

AGA permettent respectivement d'obtenir un site de coupure par Tenzyme BamHl 

(indiquS en gras) et un site de coupure par Tenzyme Xbal peraiettant Tinsertion ou 

Textraction de la totality de la sequence codant la protdne recombinante selon 

I'invention dauis un plasmide. 
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c) u&e r^on de fixation et permettant la purification de la prot^ine recombinante 
diiniiriqae : une sequence hexahistidine est ajoutte en C-terminal afin de &dliter 
ult^eurement Vitape de purification de la protSine recombinante chim&ique. Ce 

5 . peptide, cod^e par la sequence nucltotidique SEQ ID N''21 : CAC CAT CAC CAT 
CAC CAT, correspond k la sequence SEQ ID N*^2 : HHHHHH. 
A titre indicatif^ cette region de fixation particuli^re, comprenant une succession 
d'histidine, permet notamment la fixation orimt6e de la proteine recombinante sur un 
support constitu6 de silice ou d'oxydes m^talliques, tel que d6crit dans le brevet FR-B- 

10 98/04879. 

L'ordre des sequences codant les difif^rentes regions 6pitopiques immunodominantes de 
la prot6ine recombinante chim6rique peut etre 6vetxtuellement modifi6. Certains 
epitopes peuvent etre pr6sCT^t6s plusieurs fois au sein de la proteine recombinante 
IS . chim^rique. Les epitopes peuvent 6galemeat presenter des variations par rapport aux 
sequences d&rites dans Texemple d dessus selon le sous type ou le clone HIV qu'ils 
repr&entent La longueur des regions de liaison peut SgolemCTt 6tre modifi^e pour 
ameliorer TaccessibilitS d'un Epitope. BaGn^ les regions de fixation peuvent etre 
ins6r6es au sein des regions de liaisons. 

20 

Ainsi, les inventeurs ont mis ea Evidence que des s^uences Spitopiques plus courtes 
que celles d6crites prScSdemment pmvent Sgalement etre utilis6es. Ces sequences 
permettent : 

• la reconnaissance des anticoros anti-HIV-1 f anoupe M^ . : 

25 La sequence SEQ ID N^27 est issue de la souche virale HIV-1 groiq)e M (clone de 
r^f^rence HXB2) et correspond a la s&]ueace suivante : 

SEQ ID N°27 : GAA AGA TAC CTA AAG GAT CAA CAG CTC CTA GGG ATT 
TGG GGT TGC TCT GGA AAA CTC ATT TGC ACC ACG 

Ce fi'agment nucl6otidique code pour le peptide correspondant k la sequence ea acides 
30 amines SEQ ID N°28 : ERYLKDQQLL GIWGCSGKLI CTT, 

• lareconnaisfiflncfi des anticorps anti-HIV-1 (groupe O : fip41'> : 
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La s^ence SEQ ID N** 29 coirespond iune s6queiice ADN artifidelle, con9ue ipartir 
de la sequence ea adde amin^ de la souche virale HIV-1 gcoupe O [clone ANT70]. 
Cette poitioii synttidtique a 6t6 con9ue en s61ectionnant des codons dont rutilisation est 
&vorable k Texpression de g&ie chez E. colu La sequence est la suivante : 
5 SEQ ID 29 : GAA ACC CTG CTT CAG AAC CAA CAG CTG CTT TCT CTG 
TGG GOT TGC AAA GGT AAG CTG GTT TGC TAG ACC 

Ce fragment nucl6otidique code pour le peptide coirespondant h la s6quence en addes 
aminfe SEQ ID N^30 : ETLLQNQQLL SLWGCKGKLV CYT. 
• la reconnaissance des anticorps anti-HIV-2 fgp36^ : 
10 La sequence SEQ ID N°31 est issue de la souche virale HIV-2 (clone de r6f6rence 
ROD) et correspond k la sequence suivante : 

SEQIDN^31 rCTAAATTCATGGGGATGTGCGTTTAGACAAGTCTGC 
Ce fragment nucl6otidique code pour le peptide correspondant k la sequence en addes 
aminfe SEQ ID N^32 : LNSWGCAFR QVC 

15 

De plus, les inventeurs ont Sgalement utilises les regions de liaisons suivantes : 

• la sequence nucltotidique SEQ ID N**41 CTG CAC CAT ATC CTG GAA GCC 
CAG CGT ATG GAA TGG CAC CCG CAC AAA GGT TCT GGA TCC qui 
correspond k la sequence en addes amin& SEQ ID N°42 IHHILEAQRM 

20 EWHPHKGSGS 

• la sequence nucltotidique SEQ ID N**43 CTG CAC CAT ATC CTG GAG GCT 
CAA CGT ATG GAG TGG CGC GAA TCC CAT GGT qui correspond k la 
sequence en addes amines SEQ ID N^44 UEIHILEAQRM EWRESHG 

• la sequence nucltotidique SEQ ID N° 45 GGT CTG AAC GAC ATC CTG 
25 GAA GCC CAG CGT ATG GAA TGG CAC GAG TCT GCA GGC qui 

correspond k la s6quCTice en addes amines SEQ ID N^46 GLKDILEAQR 
MEWHESAG 

• la sequence nucl6otidique SEQ ID N*'47 CTG AAC GAT ATT TTC GAA GCG 
CAG CGT ATT GAA TGG CAT GAG GGT TCT GGA TCC qui coirespond k 

30 la sequence m acides amines SEQ ID N°48 LNDIFEAQRI EWHEGSGS 
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Le remplacemeat d'une aiginme par une lysine an sein d'une i^^on de liaison telle que . 
d^fime d dessus peimet la fixation d'une biotine qui pennet d'obtesoir une region de 
fixation aa sdn de la r^on de liaison. 

Les inventeuis ont ainsi utiUs^ les s^uences suivantes qui pomettaient non seulemeat 
de lier les regions 6pitopiques entre elles mais 6galement de fixer la prot&ie 
recombinante dumSrique selon rinvention sur un siq>port, ou de fedliter sa 
purification. 

Ainsi, les inventeurs ont dgaletnent utilises les regions de liaisons suivantes : 

• la sequence nud^otidique SEQ ID N°33 CTG CAC CAT ATC CTG GAA GCC 
CAG AAA ATG GAA TGG CAC CCG CAC AAA GGT TCT GGA TCC qui 
correspond k la s6quenc6 en addes amin& SEQ ID N°34 LHHTT.FAQKM 
EWHPHKGSGS 

• la s6quence nucl^otidique SEQ ID N^BS CTG CAC CAT ATC CTG GAG GCT 
GAA AAG ATG GAG TGG CGC GAA TCC CAT GGT TCC CAT GGT qui 
correspond h la sequence en addes anoines SEQ ID N''36 LHHILEAQKM 
EWRESHG 

• la sequence miclfotidique SEQ ID N^S? GGT CTG AAC GAC ATC CTG 
GAA GCC CAG AAA ATG GAA TOG CAC GAG TCT GCA GGC qui 
conespon k la SEQ ID N°38 GLKDILEAQK MEWHESAG 

• la sequence nud6otidique SEQ ID N<*39 CTG AAC OAT ATT TTC GAA GCG 
CAG AAG ATT GAA TGG CAT GAG GGT TCT GGA TCC qui conespond k 
la sequence ea addes amines SEQ ID N°40 LNDIFEAQKI EWHEGSOS 

Les sequences prisent^es d dessus ont penms la construction de la ptotdne 
recombinante diimMqiie bHIV86. 

Ainsi, la sequence nucltotidique SEQ ID N°49 a ^ con9ue pour coder une protdne 
recombinante selon I'invention, et clon6e dans tin vecteur d' expression. 
SEQ ID N''49: ATG AGG GGA TCT CTG CAC CAT ATC CTG GAA GCC CAG 
AAA ATG GAA TGG CAC CCG CAC AAA GGT TCT GGA TCC GAA AGA TAC 
CTA AAG GAT CAA CAG CTC CTA GGG ATT TGG GGT TGC TCT GGA AAA 
CTC ATT TGC ACC ACG AGC TCC CTG CAC CAT ATC CTG GAG GCT CAA 
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AAG ATG GAG TGG CGC GAA TCC CAT GGT CTA AAT TCA TGG GGA TGT 
GCG TTT AGA CAA GTC TGC TCG AGO GGT CTG AAG GAG ATC CTG GAA 
GCC GAG AAA ATG GAA TGG CAC GAG TCT GCA GGC GAA AGO CTG CTT 
CAG AAC CAA CAG CTG CTT TCT CTG TGG GGT TGC AAA GGT AAG CTG 
5 GTT TGC TAG ACC AAA GCT TCC CAC CAT CAC CAT CAC CAT TGA TCT 
AGA 

La prot^e recombinaQte dmndiique cod6e par la sequence SEQ ID N°50 est la 
suivante : 

SEQ ID N»50 : MRGSLHHILE AQKMEWHPHK GSGSERYL.KD QQLLGIWGCS 

10 GKLICTTSSL HHnmQKME WRESHGLNSW GCAFRQVCSS GLKDDJBAQK 
MEWHESAGET LLQNQQLLSL WGCKGKLVCY TKASHHHHHH 

Les regions ^topiques sont indiquSes en gras, la i6gi<m de fixation en italique et les 
regions de tiaisons en non gras mm italique. 

15 

De m&ne, les sequences pr^sent^ pr6c6demment ont permis la construction de la 
prot^ine recombinante chim6rique bHIV98 dans laquelle la sequence hexa histidine a 
6t6 d6plac6 ea N terminal, afin de fiiciliter sa purification. 

Ainsi, la s&juence nucl6otidique SEQ ID N°51 a 6t6 con^ue pour coder une prot6ine 
20 recombinante selon Tinvention, et clon6e dans un vecteur d' expression. 

SEQ ID N^Sl: ATG AGO GGA TCT CAC CAT CAC CAT CAC CAT GGT CTG 
AAC GAT ATT TTC GAA GCG CAG AAG ATT GAA TGG CAT GAG GGT TCT 
GGA TCC GAA AGA TAC CTA AAG GAT CAA CAG CTC CTA GGG ATT TGG 
GGT TGC TCT GGA AAA CTC ATT TGC ACC ACG AGC TCC CTG CAC CAT 
25 ATC CTG GAG GCT CAA AAG ATG GAG TGG CGC GAA TCC CAT GGT CTA 
AAT TCA TGG GGA TGT GCG TTT AGA CAA GTC TGC TCG AGC GGT CTG 
AAG GAC ATC CTG GAA GCC CAG AAA ATG GAA TGG CAC GAG TCT GCA 
GGC GAA ACC CTG CTT CAG AAC CAA CAG CTG CTT TCT CTG TGG GGT 
TGC AAA GGT AAG CTG GTT TGC TAC ACC TGA A GCT T 
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La piot6me reooxnbinaiite chim&ique cod6e par la sequence SBQ ID N^S2 est la 
suivante: 

SEQ ID N**52 : mLGSHHHHHH GLNDDPEAQK BBWHEGSGSE RYLKDQQLL6 
IWGCSGKLIC TTSSLEIHILE AQKMEWRESH GLNSWGCAFR QVCSSGUODI 
5 IJEAQKMEWHESAGETLLQNQQIXrSLWGCKGKLVCOT 

Les regions 6pitopiques sont indiqudes en gras, la r6gion de fixation en italique et les 
regions de liaisons en non gras non italique. 

Exemple 2 : Expression et purification des prot£ines recombinantes chim^riques 
10 b-EOV 72, b-HIV86etb-HIV98 de r exemple 1 

La premiere £tape consiste h insurer la sequence SEQ ED N^l (exemple 1), dans nn 
vecteur d'expression ^MR) puis h transformer une bact^e E. coli (souche BL21) avec 
la construction plasmidique obtenue selon un protocole classique de clonage connu de 
rhonune du metier. Les bact^ries transform6es sont s61ectionn6es gr&ce k leur 

15 resistance k Tampicilline port6e par le vecteur pMR. 

Un clone de bactSrie recombinante est alors s£lectionn6 pour ensemencer une prSculture 
de 40 ml de milieu 2x YT (tryptone 16 g/l ; yeast extract 10 g/1 ; NaCl 5 g/1, pH 7,0) 
contenant 100 \ig/mL ampidlline. Aprbs IS & 18h d'inciibation k 37°C sous agitation & 
250 rptn, cette prSculture est utiUisSe pour ensemenc^ 1 litre de milieu 2xYT contenant 

20 2 % glucose et 100 ^g^ ampidlline. Cette culture est incubte it 37''C sous agitation k 
250 ipm, Lorsque la DO600 nm a atteint 0,7-0,9, de TIPTG (isopropjd-p-D- 
thiogalactoside, Eurogentec) est ajoutS k 0,5 mM final dans le milieu de culture et la 
culture est poiusuivie pendant 4 h. L'IPTG pemiet d'induire Texpiession de la prot^e 
chimdrique recombinante SEQ ID N*'2, N^50 ou N^52 qui s'accumule dans les 

25 bact^es sous forme de corps d'inclusion. Aprds 4 h d'induction, la culture est 
centrifiigte k 6000 rpm pendant 30 min k 4°C et le culot de bact&ies est congel6 k - 
80*^0. 

Afin d'extraire la prot6ine recombinante des corps d'inclusion, les bact6ries 
d6congel6es sont lys6es. Pour cela, les culots de bact&ies correspondant k xme culture 
30 d'un litre sont repris dans 100 ml de tampon de lyse (PBS IX contenant des inhibiteurs 
de proteases : lysozyme : 1 mg^ml ; bmzonase : 2,5 unites par ml (Novagen®) et Mg^"** : 
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1 wM) en vortexant jusqu*^ obtenir une suspension homogdne. Cette solution est 
incubSe 1 heure k tenq>6ratu]:e anibiante sous agitation. La solution est ensuite 
centrifugSe 30 min & 4''C & 10000 g. 

Le culot obtenu contimt les corps d'inclusion. Ce culot est mis en suspension dans SO 

5 ml de tampon de solubilisation (bicaibonate de sodium : 40 mM ; NaCl : 300 mM ; 
SDS : 1% ; p-m^x:^toethanol : 20 noM, pH 9,6) contenant des inhibiteuxs de prot6ases 
(complete EDTA-free, Roche®), La solution ainsi obt^ue est incub6e 16 i 18 h sous 
agitation entre 18 et 25°C. Elle est ensuite dilute au quart avec un tampon PBS 2X 
contenant 8 mM d'inMdazole et des inhibiteurs de proteases (complete EDTA-free, 

10 Roche®) k pH 8,0. Une ceatrifugation i 10 000 g pendant 30 min k 20°C permet 
d'obtenir \m sumageant limpide, qui est filtr6 sur filtre 0,45 n et purifi6 par 
chromatographie d'afBnit6 sur une colonne de chelation de m6taux (matrice nickel- 
nitrilotriacetic add (Ni-NTA, Qiagen). Les 200 ml d*6chantillon sont d6pos6s (1 
ml/min) k 18-2S°C sur une colonne de 8 ml de gel Ni-NTA ^uilibrSe en tampon Al 

IS (PBS 2X, urSe 4 M, inudazole 6 mM, pH 7,8 contenant p-mercaptoethanol 5 mM) ou 
A2 (PBS 2X, SDS 0.2S %, imidazole 6 mM, pH 7,8 contenant p-mercaptoethanol 5 
mM). La colonne est ensuite lav6e en taxiq)on Al ou A2, jusqu'i obtention en sortie de 
colonne d'une DOasomn'^O. L'flution de la prot^e recombinante est obtenue par 
application d*un tanq[>on Bl (PBS 2X, ur£e 4M, imidazole 100 mM, pH 7,5, contenant 

20 p-m«captoeflianol 5 mM) ou B2 (PBS 2X, SDS 0.25%, imidazole 100 mM, pH 7,5, 
contenant p-mercaptoedianol 5 mM). 

Des quantity de I'ordre de 50 mg de prot6ine recombinante purifi^e peuvent 6tre 
obtenues k partir d'un litre de culture. 

La protdine recombinante ainsi purifi6e est soumise k un traitement d6naturant par 
25 addition de SDS (1500 mol6cules par molecule de proteine recombinante), DTT 5 mM, 
bicarbonate de sodium 50 mM au pH 9,6 et chaufifege 30 min k 37°C. La stockiom6trie 
molecules de SDS/ molecules de proteine recombinante peut etre modifi6e (id6alement 
diminute si la dur6e ou temperature de chauffage est augment^e). Par exemple, des 
r6sultats similaires sont obteniis par addition de 250 molecules de SDS/mol6cule de 
30 proteine recombinante, DTT 5 mM, bicaibonate de sodium 50 naM au pH 9.6 et 
chauf&ge 2 heures k 40^C. 
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La ptotSine ainsi d&iatur6e est stabilis6e par addition de Polydhyldne glycol (MW 33S0 
en particulier) pour une stocildom6trie de 10 molecules de PEG par molecule de 
prot^e puis dialyste k 4^C pendant 18 & 24 heures contre un tan^on bicaibonate de 
sodium SOmM, EDTA ImM, SDS 0,01%, PEG 1 mg/1, pH 9,6. 
5 L'expression et la purification des prot^in^ recombinantes chimSriques b-HIV86 et b- 
HIV98 ont &6 r6alis6es d'une mani&re comparable, k reception de I'^tape de 
d&naturation par SDS et DTT, qui n'est pas nfcessaire lors de la purification des 
proteines b-HIV86 et b-HIV98. L*emploi de beta mercapto6thanol dans les tampons de 
purification n'est pas n^cessaire non plxis. 

10 

Exemple 3 : Evaluation et validation de la prot6lne recombinante chim£rique b- 
mv 72, bHIV 86 et b-fflV98 dans un test VED AS® (bioMfrieux) 
Cette validation est r6alisee en test VIDAS® par Tntilisation d*une solution de prot6ine 
chim^que recombinante obtraue sdon les exemples 1 et 2 et ayant subit le traitement 

15 d^naturant d^crit dans I'exemple 2. 

Le prindpe du test VIDAS® est le suivant: \m cdne constitue le siQ)port solide qui sert 
egalement de systdme de pipetage pour les r^actifs presents dans la barrette. La pxot^ine 
recombinante est fix6e sur le cdne. Aprte une 6tape de dilution, T^chantillon est aspir6 
et refould plusieurs fi>is k Tint^eur du cdne. Ceci pennet aux IgO anti-VIH de 

20 r^chantillon de se lier k la protSine recombinante. Les composants non li6s sont 
61imin6s par lavage. Un anticorps anti-IgO humaines conjuguS k la phosphatase alcaline 
CPAL) est alois incub6 dans le c6ne ot il se fixe aux IgO anti-VIH. Des 6tapes de 
lavage Sliminmt le conjugu6 non fix& 

Pendant la demi^ ^t^e de r6v61ation, le substrat de la PAL, le 4-m6thyl"Ombelliferyl 
25 phosphate, est hydrolys^ en 4-m£thyl-ombeIlif«ron6 dont la fluorescence &nise k 450 

nm est mesurte. L'intensit^ de la fluorescence est mesur6e par le systdme optique du 

Vidas® et est proportionnelle k la presence dIgG anti-VIH presents dans TSdiantillon. 

Les r6sultats sont analyses automatiquement par le VIDAS® et exprimSs en RFV 

(Relative Fluorescent Value). 
30 Dans cet exemple, une solution de proteine recombinante obtenue selon les exemples 1 

et 2, (1,2 ^g dans un miUiUtre de tampon bicaibonate de sodium 50 mM, SDS 0,01%, 
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pH 9,6*9,8) est incabee avec les o6Qes VIDAS® 18 & 24 h & temperature ambiaate (120 
fil/cdne). Les o6nes sont ensuite incub^ dans un tampon de passivation (330 (il/cdne de 
tampon HIV Duo cont^iant 3 % de s6rum de veau) pendant 18 & 24 h & tenip6rature 
ambiante 

Des solutions tests (Etablissement Franfais du Sang, France), de s^logie HIV comme, 
(28 ^il de s&um, de statut HIV connu, dilu6 dans 300 jil de tampon PBS 1 X, NaCl 8,76 
g/1, tween 20 2,5 % (v/v), lait 6cr6m6 en poudre 2,5 g/1, albumine 20 g/1, et 3 % (v/v) 
s6rum de veau, pH 6,1) sont alors mis en contact avec les c6nes pr6sentant les prot6ines 
recombinantes de Texemple 1, pendant 13 min et 20 secondes (80 cycles de 
pipettage/refoulement de 10 secondes). Une 6tape de lavage est ensuite effectu^e en 
tampon Tris 24,23 g/1, acide mal6ique 23,22 g/1, tween 20 0,05% (v/v), NaOH 6 g/1, 
NaCl 8,77 g/1, pH 6,1. Une solution d'anticorps anti-Fc hxmiain conjugu6 k la PAL 
(P5F2F7) et dilu6 au 1/5000*°^ est incub6e au contact du c6ne pendant 5 min (avec 30 
cycles de pipettage /refoulement de 10 secondes chacim). Une demidre 6tape de lavage 
est r6alis6 en tampon HIV Duo, avant T^tape finale de revelation. 
Les r&niltats obtmus, sont exprim6s en RFV (Relative Fluorescent Value). Les valeurs 
RFV sup4rieures ou 6gales h 250 sont aibitrairement consid6r6es comme provenant 
d*un s&xim HIV s6ro positifi. Les valeurs infi§rieures sont negatives. Les r^sultats 
obtenus avec la protSine recombinante obtenue selon les exemples 1 et 2, sont tons en 
accord avec la s£rologie HTV, prSalablement dStenninte par le test VIDAS HIV Duo® 
(bioM^eux®). 

L'utilisation d'une telle prot^e recombinante en test VIDAS® pennet bien de 
dStraniner la s&ologie HIV des echantillons. 
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Tableau 1 - Validafion e^^timentale de la prot^me reooznbinante b-HIV72 obtonie selon les exsa^les I 
et2 



Solution calibrateur / sera 


R£f(§rences serum 


RFV (relative fluorescent value) 


Sera EOVl-M positifs 


9991574 


9820 




9991504 


9346 




9991544 


9621 




9991524 


9735 




9991500 


9914 


Sera HIVl-O positifs 


48 


786 


Sera mV 2 positifs 


7312A 


9174 




JS8-1002 0008 


8475 




JS8-1002 0009 


9532 




JS8-1002 0010 


9472 




JS8-1002 0013 


9526 




JS8-1002 0014 


9695 




JS8-1002 0016 


9872 




JS8-1002 0017 


9090 




JS8-1002 0018 


9241 




JS8-1002 0020 


9391 


Sera HIV s^ron^atife 


203 


139 




222 


171 




262 


105 




263 


84 




280 


182 




285 


86 




287 


127 




291 


173 




gl0653 


193 




gl2290 


122 




gl3461 


170 




gl3818 


192 




gl3830 


106 




p03512 


176 



wo 2004/027066 




PCT/FR2003/002712 



Des rteultats cdnq)arables ont 6t6 obtemis avec les prot&ies recombinantes 
chim&iques b-HIV86 et b-HIV98. 

Exemple 4 : Constraction d'une protSine recombinante biotmylee 

5 Une sequence consensus de biotinylation in vivo dans E.coli telle que d&aite par 
Schatz, (Bio/tedmology, vol. 11, 1993) peut 6tre fusionnte k la SEQ ID n^2 
L'addilion de la sequence SEQ ID N^23 : 5' CTG CAC CAT ATC CTG GAA GCC 
GAG AAA ATG GAA TGG CAC CCG CAC, codant le peptide de sequence SEQ ID 
N*=*24 : LHHTT.KAQKM EWHPH, pennet la biotinyiation de la proteine recombinante b 
10 HIV72 obtenue selon les exemples 1 et 2 afin d'utiliser une protdne avidine conjugal 
^ une CTLzyme pour la phase de r6v61ation dans un test EIA. 

Lgs conditions d'expression et purification decrites dans Texemples 2 restent valides 
avec quelques modifications. Les bactSries transformees avec le plasmide recombinant 
15 peuvent etre de type BL21 ou AVBlOl (Avidity, LLC). Le milieu de culture utilise 
pour 1' expression pait etre de type : 2x YT (tryptone 16 g/1 ; yeast extract 10 g/1 ; NaCl 
S g/1, pH 7,0) oontenant 100 \ig/wl aiiq>icilline et suppl&nente par 12 \ig par ml de 
biotine. 

20 Exemple 5 : Evaluatton et validation de la protiine recombinante ddmSrique 
biotinjiSe in vivo tel que dtoite dans I'exemple 4 dans un test VIDAS® de type 
sandwidi. 

Cette validation est selon un protocole VIDAS® d^ciit dans rexenq>le 3 et modifi6 
comme suit : la prot^e diim6rique recordbinante bHIV-72, non biotin}46e obtenue 

25 selon I'exemple 1 est fix£e sur la phase solide (cdne VIDAS®) comme d6crit dans 
Texemple 3. Apres incubation de I'Schantillon dilu6 avec le cdne puis lavage, les Ig G 
anti HIV li^ aux c6nes sont incub^es avec ime protdine chim6rique recombinante 
biotinylte in vivo et obtenue selon Texemple 4. Aprds lavage, les prot^es 
recombinantes biotynyl6es fix^ sur le c6ne r&igissent avec une solution de 

30 streptavidine conjugu6 k la PAL. L*6tape finale de revelation est conforme k la 
description de Texemple 3. 
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Les r^sultats sont pr^»t6s dans le tableau 2. Les valeurs RPV supSrieures ou 6gales k 
2S0 sont arbitrairement consid6rtos comme positives. L'litilisation d'une telle prot6ine 
tecombinante en test VIDAS® pennet bien de determiner la s&rologie HIV des 
^chantillons. 

Tableau 2 - Validation ejqpSrimentale de la prot&ie tecombinante obtenue selon les 
exemples 4 et S 



Solution calibrateur / sera 


Ref (fences s^ram 


RFV 


S£raHIVn6gatifs 


CTS8 


195 




g06976 


214 




g31377 


170 


Sera HIV 1 M positifs 


9991574 


4708 




9991504 


1395 


Sera HIV 2 positif 


JS8-1002 0008 


2562 




JS8-1002 0009 


3754 



Exemple 6 : Evaluation et validation des proteine recombinante chimerique billV- 
86 et bHIV-98 dans un test VIDAS® de type sandwich. 

La pr^sCTce de la s6quence SEQ ID N^33, 35 37 ou 39 codant respectivement les 
peptides SEQ ID N°34i 36, 38 et 40 permet aux prot6ines bHrV86 et bHIV98 d'etre 
biotinyl6es in vivo, d'une &9on conoparable a ce qui est dScrit dans I'exemple 4. 
Cette validation est selon un protocole VIDAS® d6ciit dans Pexemple 3 et modifi^ 
comme suit : la protSine cbimSrique recombinante bHIV-72, non biotinyl6e obtenue 
selon I'exemple 1 est fix6e sur la phase solide (cdne VIDAS®) comme ddcrit dans 
Texemple 3. Aprfes incubation de T^chantillon dilu6 avec le c6ne puis lavage, les Ig G 
anti HIV li^ aux odnes sont incubSes avec une prot^e chim&ique recombinante 
biotinyiSe in vivo (bHIV-86 ou bHIV-98). Apr^ lavage, les prot6ines recombinantes 
biotynyl6es fix6es sur le c6ne rdagissent avec ime solution de streptavidine conjugu^ k 
la PAL. L'6t^e finale de radiation est conforme k la description de I'exemple 3. 
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Des resultats comparables k ceux d&rifs dans Texemple 5 ont obtenues avec les 
protfines bHIV-86 et bHIV-98. 

Exemple 7 : Amfilioratioii de la sensibility de la protBne recomblnante chim^riqae 

S Afin d'augmenter encore la sensibility de reconnaissance des anticorps anIi-HIV de la 
prot^ine reoombinante obtenue selon Tinvention de nouveaux ^itopes caractdristiques 
de certains sous-types HIV peuvent Stre ajout6s ou m des Epitopes d6crit peut etre 
dupliqu^ dans la sequence de la proteine chim^rique. 

10 Exemple 8 : Addition d'line sequence hexalysine a la proteine recombinante pour 
faciliter le couplage d'une enzyme ou de biotlne, notanunent snr la fonction p- 
amin£ de la lysine. 

Une sequence codant pour six lysines peut 6tre fusionnee en 3* de la SEQ ID n°2. 
L'addition de la s6quence ADN SEQ ID n^25: AAG AAA AAG AAA AAG AAA, 
IS codant pour le peptide de sequence SEQ ID n^'ie : KKXKKK, pennet le coi:qplage 
orients d'razyme ou biottne en C-terminal de la proteine cbim&ique. Le couplage de 
cette prot^e recombinante k la phosphatase alcaline en particulier pennet Tutilisation 
de la prot6ine coapl€e dans un format sandwich de r6v61ation des anticorps anti-HIV. 
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REVENDICATIONS 



10 



15 



20 



25 



1 . ADN recombinant codant une proteine recombinante chim^rique comprenant 

• au moins deux premiers firagments nucl6o1idiques codant chacun une 
region epitopique du vims HIV-1 de groiQie M ou de groupe O ou le 
virus HIV-2 

• aa moins un deuxidme fragment nucl^otidique codant une region de 
liaison, 

• au' moins un troisidme fragment nuclfotidique codant une region de 
fixation 

caract&dsS en ce que chaque premiers fragments nudtotidiques code au moins une 
region immunodominante de la glycoprot^ine gp 120 d'HIV-1, de la gjlycoprotSine 
gp 41 d'HIV-1 de groupe M, de la glycoprot6ine gp 41 d'HIV-1 de groiqie O ou de 
la ^ycoprot6ine gp 36 d'HIV-2. 

2. ADN, selon la revendication 1, caractSris6 en ce que ledit premier fragment 
nucltotidique a pour s^uence Tune quelconque des s^qu^ces SEQ ID N^3, SEQ 
ID N**5, SEQ ID N^7, SEQ ID N**9, SEQ ID N^27, SEQ ID N^29 ou SEQ ID N^Sl. 

3. ADN recombinant, selon Pune quelconque des revendications 1 ou 2, caract6ris6 
en ce que ledit deuxieme fragment nucltotidique comprend au moins un site de 
coupure. 

4. ADN recombinant, selon Tune quelconque des revendications 1^3, caract6ris6 
en ce que ledit deuxieme fragment nucl6otidique a pour s6quence au moins Tune 
quelconque des s^uences smvantes, prises seules ou en combinaison, SEQ ID 
N^l 1 SEQ ID N°13, SEQ ID N°15, SEQ ID N°17, SEQ ID N°19, ou SEQ ID N*'20, 
SEQ ID N°33, SEQ ID N^35, SEQ ID N^37, SEQ ID N°39, SEQ ID N°41, SEQ ID 
N^43 SEQ ID N°45, ou SEQ ID N«47 
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10 



15 



20 



5 ADN recombinant selon I'nne qudconque des revendications 1 k4 caiact6ris6 en 
ce que ledit troisidme fragment nucl6otidique codant une region de fixation est 
indus dans ledit deuxi^e fragment nud^otidique codant tme rSgion de liaison. 

6 ADN, selon Time quelconque des revendications 1 & S, caract6ris6 en ce que ledit 
troisieme fragment nucl6otidique a pour s6quence I'une quelconque des sequences 
SEQ ID N^21, SEQ ID 23, SEQ ID N^25, SEQ ID N°33, SEQ ID N°35, SEQ ID 
N°37ouSEQIDN°39. 

7. Prot6ine recombinante chim^rique cod6c par un ADN recombinant, selon Tune 
quelconque des revendications 1^6, comprenant 

• au moins deux regions ^itopiques du virus HTV-l de groupe M ou de 
groiipe O ou le virus HIV-2, 

• au moins une r^onde liaison 

• au moins une region de fixation. 

8. ProtSine, selon la revendication 7, caract6ris6e en ce que ladite region de liaison 
est un peptide comprenant au moins une glycine et/ou au moins une serine. 

9. Prot^ine, selon la revendication 8, caiact^isfe en ce que ladite r^on de liaison a 
pour sdqu^ce Tune quelconque des s&pimces SEQ ID N° 12, SEQ ID N^14, SEQ ID 
N^16 ou SEQ ID N*'18, 34, 36, 38, 40, 42, 44, 46, 48. 

10. Prot6ine, selon la revendication 7, caract6ris6e en ce que ladite region de fixation 
est une region riche en histidines et ses dMv6s, tel qu'une region contenant une density 
d'histidines, sup^eure ou 6gale k 25%, et pr6f6rentiellement sup6rieure ou 6gale k 



33%. 



30 



11. Prot6ine selon la revendication 7 caract6ris6e en ce que ladite region de fixation est 
un peptide comprenant au moins ime lysine. 
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12. Proteme selon la revendicadon 7 caraot6iis6e en ce que ladite region de fixation 
a pow sequence SEQ ID >r22, 24 , 26, 34, 36, 38 ou 40. 

13. Vecteur d'expression compreoant un ADN recombinant selon Tune quelconque 
des revendications Ik 6. 

14 Utilisation d'au moins un ADN selon Tune quelconque des revendications 1^6 
et/ou d'au moins une protdine recombinante chim6rique selon Tune quelconque des 
revendications 7^12 pour le diagnostic in vitro. 



• 
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SEQUENCE IiXSTXNG 



<110> 



BIOMBRXEUX SA 



<120> 



Prot^ine recomblnante ch j m^rique et diagnostic in vitro 



< 13 0 > Unlaiown 
<160> 52 

<170> PatentXn version 3.1 

<210> 1 

<211> 423 

<212> DNA 

<213> Artificial 

<400> 1 

atgaggggat ccagaatcct agctgtggaa agatacctaa aggatcaaca gctcctaggg 
atttggggtt gctctggaaa actcatttgc accactgctg tgagctccgg ttcaggcgct 
atagagaagt acctacagga ccaggcgcgg ctauiattcat ggggatgtgc gtttagacaa 
gtctgctcga gcggttctgg aggaggagat atgagggaca attggagaag tgaattatat 
aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaagtc tgcaggccgt 
ctgcttgctc tggaaaccct gcttcagaac caacagctgc tttctctgtg gggttgcaaa 
ggtaagctgg tttgctacac ctctgttaaa gcttcccacc atcaccatca ccattgatct 
aga 

<210> 2 
<211> 138 
<212> PRT 
<213> Artificial 

<400> 2 

Met Arg Gly Ser Arg Xle Leu Ala Val Glu Arg Tyr Leu Lys Asp Gin 
15 10 15 



60 
120 
180 
240 
300 
360 
420 
423 



Gin Leu Leu Gly lie Trp Gly Cys Ser Gly Lys Leu lie Cys Thr Thr 
20 25 30 
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Ala Val Ser Ser Qly Ser Gly Ala Xle Glu Lys Tyr Leu Gin Asp Gin 
35 40 45 



Ala Arg Leu Asn Ser Trp Gly Cys Ala Phe Arg Gin Val Cys Ser Ser 
50 55 60 



Gly Ser Gly Qly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr 
65 70 75 80 



Lys Tyr Lys Val Val Lys He Glu Pro Leu Gly Val Ala Pro Thr Lys 
85 90 95 



Ser Ala Gly Arg Leu Leu Ala Leu Glu Thr Leu Leu Gin Asn Gin Gin 
100 105 110 



Leu Leu Ser Leu Trp Gly Cys Lys Gly Lys Leu Val Cys Tyr Thr Ser 
115 120 125 



Val Lys Ala Ser His His His His His His 
130 135 



<210> 3 

<211> 90 

<212> DliEA 

<213> HIV 1 



<400> 3 

agaatcctag ctgtggaaag atacctcuiag gatceiacagc tcctagggat ttgg g gttgc 60 
tctggciaaac tcatttgcac cactgctgtg 90 

<210> 4 

<211> 30 

<212> PRT 

<213> HIV 1 



<400> 4 



Arg He Leu Ala Val Glu Arg Tyr Leu Lys Asp Gin Gin Leu Leu Gly 
15 10 15 
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lie Trp Qly Cys Ser Gly Lys Leu lie Cys Thr Thr Ala Val 
20 25 30 



<210> 5 

<211> 90 

<212> DNA 

<213> HIV X 



<400> 5 

cgtctgcttg ctctggaaac cctgcttcag aaccaacagc tgctttctct gtggggttgc , 60 
aaaggtaagc tggtttgcta cacctctgtt 90 

<210> 6 

<211> 30 . 

<212> PRT 

<213> HIV 1 



<400> 6 

Arg Leu Leu Ala Leu Glu Thr Leu 
1 5 



Leu Gin Asn Gin Gin Leu Leu Ser 
10 15 



Leu Trp Gly Cys Lys Gly Lys Leu Val Cys Tyr Thr Ser Val 
20 25 30 

<210> 7 
<211> 69 
<212> DI3A 
<213> HIV 2 



<400> 7 

gctatagaga agtacctaca ggaccaggcg cggctaaatt catggggatg tgcgtttaga 60 
caagtctgc 69 
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<210> 8 

<2X1> 23 

<212> PRT 

<i2i3> mv 2 



<400> 8 

Ala Xle Glu Xiys Tyr Leu Gin Asp^ Gin Ala Arg Leu Asn Ser Trp Gly 
1 5 10 15 



Cys Ala Phe Arg Gin Val Cys 
20 



<210> 9 

<211> 90 

<212> DNA 

<213> HIV 1 



<400> 9 

ggaggaggag atatgaggga caattggaga agtgaattat ataaatataa agtagteuicia 60 
attgaaccat taggagtagc acccacceiag 90 

<210> 10 

<211> 30 

<2X2> PRT 

<213> HIV 1 



<400> 10 

Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr 
15 10 15 



Lys Val Val Lys Xle Glu Pro Leu Gly Val Ala Pro Thr Lys 
20 25 30 



<210> 11 
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<211> 



16 



<212> 



<213> 



Artificial 



<400> 11 
gagctccggt tcaggc 



16 



<210> 12 

<211> 5 

<212> PRT 

<213> Artificial 

<400> 12 

Ser Ser Gly Ser Gly 
1 5 

<210> 13 

<211> 13 

<212> DNA 

<213> Artificial 

<400> 13 

ctcgagcggt tct 13 

<210> 14 

<211> 4 

<212> PRT 

<213> Artificial 

<400> 14 

Ser Ser Gly Ser 



1 
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<210> 15 

<211> 9 

<212> DNA. 

<213> Artificial 

<400> 15 

tctgcaggc 9 

<210> 16 

<211> 3 

-<212> PRT 

<213> Artificial 

<400> 16 
Ser Ala 61y 



<210> 17 

<211> 9 

<212> DNA 

<213> Artificial 

<400> 17 

aaagcttcc 9 

<210> 18 

<211> 3 

<212> PRT 

<213> Artificial 

<400> 18 
Lys Ala Sex 



1 



1 
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<210> 19 

<211> 12 . 

<212> DNA 

<213> Artificial 

<400> 19 

atgaggggat cc 12 

<210> 20 

<211> 17 

<212> BNA 

<213> Artificisa 



<2ld> 21 

<211> 18 

<212> DNA 

<213> Artificial 

<400> 21 

caccatcacc atcaccat 18 

<210> 22 

<211> 6 

<212> PRT 

<213> Artificial 

<400> 22 

His His His His His His 
1 5 



<400> 20 

artcaatgag gggatcc 



17 



m 
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<210> 23 

<211> 45 

<212> DNA 

<213> Artificial 

<400> 23 



<210> 24 

<211> 15 

<212> PRT 

<213> 2^ti£icial 

<400> 24 

Leu His His lie lieu Glu Ala Gin Xiys Met Glu Txp His Pro His 
15 10 15 

<210> 25 

<211> 18 

<212> DNA 

<213> Artificial 

<400> 25 

aagaaaaaga aaaagaaa 18 

<210> 26 

<211> 6 

<212> PRT 

<213> Artificial 



ctgcaccata tcctggaagc ccagaaaatg gaatggcacc cgcac 



45 



<400> 26 



Lys Lys Lys Lys Lys Lys 
1 5 
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<210> 27 

<211> 69 

<212> Dm 

<213> HIV 1 

<400> 27 

gaaagatacc taaaggatca acagctccta gggatttggg gttgctctgg aaaactcatt 60 
tgcaccacg es 

<2X0> 28 

<211> 23 

<212> PRT 

<213> HIV 1 

<400> 28 

Glu Arg Tyr lieu liys Asp Gin Gin Leu Leu Gly He Trp Gly Cys Ser 
15 10 15 

Gly Lys Leu He Cys Thr Thr 
20 

<210> 29 
<211> 69 
<212> DNA 
<213> HIV 1 



<400> 29 
gaaaccctgc 



ttcagaacca acagctgctt tctctgtggg gttgcaaagg taagctggtt 



60 



tgctacacc 



69 



<210> 



30 



<211> 23 



<212> PRT 
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<213> HIV 1 



<400> 30 



61u Thr lieu Zieu Gin Asn Gin Gin lieu Leu Ser lieu Trp Gly Cys Lys 
15 10 15 



Gly Lys IiBu Val Cys Tyr Thr 
20 

<210> 31 
<211> 36 
<212> DNA 
<213> HIV 2 

<400> 31 

ctaaattcat ggggatgtgc gtttagacaa gtctgc 36 

<210> 32 

<211> 12 

<212> PRT 

<213> HIV 2 

<400> 32 

Leu Asn Ser Trp Gly Cys Ala Phe Arg Gin Val Cys 
15 10 

<210> 33 

<211> 60 

<212> DNA 

<213> Artificiaa 



<400> 33 

ctgcaccata tcc^ggaagc ccagaaaatg gciatggcacc cgcacaaagg ttctggatcc 



60 
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<210> 34 

<211> 20 

<212> PRT 

<213> Artificial 

<400> 34 

Leu His His lie Leu 61u Ala 61n Lys Met 61u Trp His Pro His Lys 
15 10 15 



Gly Ser Gly Ser 
20 



<210> 35 

<211> 51 

<212> DNA 

<213> Artificial 

<400> 35 

ctgcaccata tcctggaggc tcaaaagatg gagtggcgcg aatcccatgg t 51 

<210> 36 

<211> 17 

<212> PRT 

<213> Artificial 



<400> 36 

Leu His His lie Leu Qlu Ala Gin Lys Met Glu Trp Arg Glu Ser His 
15 10 15 



Gly 



<210> 37 



<211> 



54 
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<212> DKA 



<213> Artificial 



<400> 37 

ggtctgeiagg acatcctgga agcccagaaa atggaatggc acgagtctgc aggc 



54 



<210> 38 

<211> 18 

<212> PRT 

<213> Artificial 

<400> 38 

Gly Leu Iiys Asp lie Leu Glu Ala Gin Lys Met Glu Trp His Glu Ser 
15 10 15 

Ala Gly 

<210> 39 

<211> 54 

<212> DNA 

<213> Artificial 

<400> 39 

ctgaacgata ttttcgaagc gcagaagatt gaatggcatg agggttctgg atcc 54 

<210> 40 

<211> 18 

<212> PRT 

<213> Artificial 



<400> 40 



Leu Asn Asp He Phe Glu Ala Gin Lys He Glu Trp His Glu Gly Ser 
15 10 15 
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Oly Ser 

<210> 41 

<211> 60 

<212> DNA 

<213> Artificial 

<400> 41 

ctgcaccata tcctggaagc ccagcgtatg gaatggcacc cgcacaaagg ttctggatcc 60 

<210> 42 

.<211> 22 

<212> PRT 

<213> Artificial 

<400> 42 

Leu His His Xle Leu Glu Ala Gin Arg Met Glu Trp His Pro His Pro 
15 10 15 

His Lys Gly Ser Qly Ser 
20 

<210> 43 

<211> 51 

<2i2> DNA 

<213> Artificial 



<400> 43 

Ctgcaccata tcctggaggc tcaacgtatg gagtggcgcg aatcccatgg t 



51 



<210> 44 



<211> 



17 



<212> PRT 
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<213> Artificial 



<400> 44 

Leu His His lie Leu Glu Ala Gin Arg Met Glu Trp Airg Glu Ser His 
1.5 10 15 

Gly 

<210> 45 

<211> 54 

<212> DNA 

<213> Artificial 



<400> 45 

ggtctgaagg acatcctgga agcccagcgt atggsiatggc acgagtctgc aggc 54 
<210> 46 



<211> 18 



<212> PRT 

<213> Artificial 



<400> 46 



Gly lieu Lys Asp Xle Leu Glu Ala Gin Arg Met Glu Trp His Glu Ser 
15 10 15 

Ala Gly 

<210> 47 

<211> 54 

<212> DNA 

<213> Artificial 



<400> 47 
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ctgaacgata ttttcgaagc gcagcgtatt gaatggcatg agggttctgg atcc 54 

<210> 48 

<211> 18 

<212> PRT 

<213> Artificial 

<400> 48 

Leu Asn Asp lie Phe Glu Ala Gin Arg Xle Glu Trp His Glu Gly Ser 
15 10 15 

Gly Ser 

<210> 49 

<211> 399 

<212> DNA 

<213> Artificial 



<400> 49 






atgaggggat 


ctctgcacca tatcctggaa gcccagaaaa tggaatggca cccgcacaaa 


60 


ggttctggat 


ccgaaagata cctaeiaggat caacagctcc tagggatttg gggttgctct 


120 


ggaaaactca 


tttgcaccac gagctccctg caccatatcc tggaggctca aaagatggag 


180 


tggcgcgaat 


cccatggtct aaattcatgg ggatgtgcgt ttagacaiagt ctgctcgagc 


240 


ggtctgaagg 


acatcctgga agcccagaaa atggaatggc acgagtctgc aggcgaaacc 


300 


ctgcttcaga 


accaacagct gctttctctg tggggttgca aiaggtaagct ggtttgctac 


360 


accaaagctt 


cccaccatca ccatcaccat tgatctaga 


399 



<210> 50 

<211> 130 

<212> PRT 

<213> Artificial 
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<400> 50 

Met Arg Gly Ser Leu His His He Leu Glu Ala Gin Lys Met Glu Trp 
15 10 15 



His Pro His Lys Gly Ser Gly Ser Glu Arg Tyr Leu Lys Asp Gin Gin 
20 25 30 



Leu Leu Gly He Trp Gly Cys Ser Gly Lys Leu He Cys Thr Thr Ser 
35 40 45 



Ser Leu His His He Leu Glu Ala Gin Lys Met Glu Trp Arg Glu Ser 
50 55 60 



His Gly Leu Asn Ser Trp Gly Cys Ala Phe Arg Gin Val Cys Ser Ser 
65 70 75 80 



Gly Leu Lys Asp He Leu Glu Ala Gin Lys Met Glu Trp His Glu Ser 
85 90 95 



Ala Gly Glu Thr Leu Leu Gin Asn Gin Gin Leu Leu Ser Leu Trp Gly 
100 105 110 



Cys Lys Gly Lys Leu Val Cys Tyr Thr Lys Ala Ser His His His His 
115 120 125 



His His 
130 



<210> 51 

<211> 386 

<212> DNA 

<213> Artificial 

<400> 51 

atgaggggat ctcaccatca ccatcaccat ggtctgciacg atattttcga agcgcagaag 60 

attgaatggc atgagggttc tggatccgaa agatacctaa aggatcaaca gctcctaggg 120 

atttggggtt gctctggaaa actcatttgc accacgagct ccctgcacca tatcctggag 180 

gctcaaaaga tggagtggcg cgaatcccat ggtctaaatt catggggatg tgcgtttaga 240 

csiagtctgct cgagcggtct gaaggacatc ctggaagccc agaaaatgga atggcacgag 300 
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tctgcaggcg aaaccctgct tcagaacceia cagctgcttt ctctgtgggg ttgcaaaggt 360 
aagctggttt gctacacctg aagctt: 386 

<2X0> 52 

<211> 126 

<212> PRT 

<213> Artificial 

<400> 52 

Met Arg Gly Ser His His His His His His 61y Leu Asn Asp lie Phe 
1 5 10 15 

Glu Ala Gin liys He Glu Trp His Glu Gly Ser Gly Ser Glu Arg Tyr 
20 25 30 

Leu Lys Asp Gin Gin Leu Leu Gly He Trp Gly Cys Ser Gly Lys Leu 
35 40 45 

He Cys Hit Thr Ser Ser Leu His His He Leu Glu Ala Gin Lys Met 
50 55 60 

Glu Trp Arg Glu Ser His Gly Leu Asn Ser Trp Gly Cys Ala Phe Arg 
65 70 75 80 

Gin Val Cys Ser Ser Gly Leu Lys Asp He Leu Glu Ala Gin Lys Met 
85 90 95 

Glu Trp His Glu Ser Ala Gly Glu Thr Leu Leu Gin Asn Gin Gin Leu 
100 105 110 

Leu Ser Leu Trp Gly Cys Lys Gly Lys Leu Val Cys Tyr Thr 
115 120 125 



2 



